Day 4【核心概念】認識 RAG 架構與其在對話機器人中的應用

2025 iThome 鐵人賽

DAY 4

Software Development

建構跨平台AI對話機器人：從LINE到Telegram實踐SDGs推廣的30天專案紀實系列第 4 篇

17th鐵人賽 rag

shammi

2025-09-04 11:42:25

276 瀏覽

分享至

HI！大家好，我是 Shammi 😊

在開發程式前也需要了解 AI 基本應用，一起來認識RAG架構是什麼吧！
開始前，你有沒有想過，為什麼有些 AI 機器人會一本正經地胡說八道呢？
我已經在 Day 3 已準備好了所有工具，但如果沒有正確的「建築藍圖」，辛苦打造的機器人，很可能在回答 SDGs 議題時，會給出不正確的答案。這對我的專案目標來說，是致命的缺陷。

今天的挑戰就是要用日常的方式來介紹這個藍圖的核心秘密：一個能讓 AI 擁有「正確知識」的強大架構——> RAG。

🌐 一、為什麼傳統 AI 對話機器人會說謊？

在 Day 1和 Day 2，我已經在思考著要如何打造一個能正確推廣 SDGs 知識的機器人。但你可能聽過，傳統的 AI 機器人（LLM）有時會「一本正經的胡說八道 (幻覺 hallucination)」(曲博口吻)，也就是憑空捏造事實。

這對我的專案來說是最致命的，因為 SDGs 的推廣需要準確與可靠的資訊。這時候需要給機器人一個強而有力的解決方案。

🌐 二、認識 RAG 架構：給 AI 一本正確的百科全書

RAG，全名為 Retrieval-Augmented Generation，中文可以翻譯為「檢索增強生成」。它的概念其實很簡單，就像是給一個聰明的學生一本專門的百科全書，讓他在回答問題前，可以先去查閱正確的資料，而不是憑空想像。

這個架構主要分為兩個核心階段：
1️⃣ 檢索 (Retrieval)：當使用者提問時，機器人會先到「外部知識庫」（Day 5將會處理的 PDF 文件）中，快速搜尋與問題最相關的資訊。
2️⃣ 生成 (Generation)：機器人接著會將「使用者提問」與「檢索到的相關資訊」一起交給 LLM。LLM 根據這些具體的參考資料來生成回覆，大大降低了「胡說八道」的機率。

🌐 三、RAG 在 SDGs 專案中的應用

那 RAG 架構在機器人專案中，具體是如何運作的呢？
我們可以以使用者的角度來想提問：「第 13 項 SDGs 的氣候行動具體是什麼？」or「氣候行動具體是什麼？」等等有關SDGs的議題。

👉 傳統 LLM：可能會給出一個很籠統、甚至不完全正確的答案。
👉 專案的 RAG 機器人：
1️⃣ 檢索：機器人會將問題轉換為向量，並從我上傳有關SDGs的PDF文件所建立的向量資料庫中，檢索出所有關於「第 13 項 SDGs」與「氣候行動」的相關段落。
2️⃣ 生成：接著，機器人會將這些檢索到的段落與使用者問題，一同傳給 Gemini Flash 模型，並根據這些資料來總結並生成一個精準的回覆。

這樣一來，就能確保機器人提供的資訊是基於我提供的知識，而不是來自網路上的隨機資料。